NVIDIA GB200 Sản xuất tăng tốc sau khi các nhà cung cấp giải quyết máy chủ AI quá nóng và rò rỉ làm mát chất lỏng
Các nhà cung cấp của Nvidia, đang sản xuất giá máy chủ AI Blackwell, đã khắc phục nhiều vấn đề kỹ thuật, giúp tăng tốc sản xuất giá máy GB200. Theo Financial Times, các nhà cung cấp như Foxconn, Inventec, Dell và Wistron đã đạt được nhiều bước tiến, cho phép việc giao hàng bắt đầu. Trước đó, việc giao hàng GB200 bị trì hoãn do các vấn đề kỹ thuật phát sinh vào cuối năm ngoái, làm gián đoạn sản xuất.
Các đối tác Đài Loan của Nvidia đã thông báo tại Computex 2025 rằng việc giao hàng các giá đỡ GB200 đã bắt đầu vào cuối quý 1 năm 2025, và công suất sản xuất đang được mở rộng nhanh chóng. Một kỹ sư từ một nhà sản xuất đối tác của Nvidia cho biết rằng các bài kiểm tra nội bộ phát hiện vấn đề về kết nối, cần phải hợp tác với chuỗi cung ứng của Nvidia từ hai hoặc ba tháng trước.
Nvidia đã công bố Blackwell Ultra B300, nhanh gấp 1,5 lần B200 với 288GB HBM3e và 15 PFLOPS FP4. Công ty cũng nhắm giải quyết vấn đề tiêu thụ nước của AI bằng cách sử dụng hệ thống làm mát kín, hứa hẹn cải thiện 300 lần. Các GPU Nvidia RTX PRO 6000D B40 Blackwell được cho là sẽ thay thế các tăng tốc H20 bị cấm ở Trung Quốc. Theo FT, các đối tác trong chuỗi cung ứng đã mất vài tháng để giải quyết các vấn đề khác với các giá rack GB200, bao gồm quá nhiệt và rò rỉ trong hệ thống làm mát bằng chất lỏng.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Các kỹ sư cho biết một số vấn đề khác bao gồm lỗi phần mềm và sự kết nối giữa các chip do sự phức tạp trong việc đồng bộ hóa nhiều bộ xử lý. Một nhà phân tích nói với FT rằng Nvidia chưa cho chuỗi cung ứng đủ thời gian chuẩn bị và rủi ro tồn kho cho GB200 sẽ giảm trong nửa cuối năm. Báo cáo cho biết, khi Nvidia chuẩn bị ra mắt GB300 dự kiến vào quý 3, họ đã phải hy sinh một số yếu tố trong thiết kế của GB300.
FT cho biết đã bỏ thiết kế bo mạch chip Cordelia để chuyển sang thiết kế cũ Bianca sử dụng trong GB200. Báo cáo cho hay hai nhà cung cấp gặp vấn đề trong việc lắp đặt, tuy nhiên, điều này sẽ ngăn chặn việc thay thế GPU riêng lẻ trong hệ thống. Thông tin này phù hợp với báo cáo hồi tháng 5, cho rằng Nvidia đang trì hoãn việc giới thiệu công nghệ bộ nhớ SOCAMM dự kiến cho Blackwell Ultra GB300, với lý do chuyển đổi từ Cordelia sang Bianca là nguyên nhân của sự hoãn lại.
Theo báo cáo trước đó và câu chuyện mới nhất từ FT, Nvidia vẫn dự định triển khai Cordelia trong các chip Rubin thế hệ tiếp theo. Hãy theo dõi Toms Hardware trên Google News để nhận tin tức, phân tích và đánh giá mới nhất. Nhớ nhấn nút Theo dõi.
Nguồn: www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-gb200-production-ramps-up-after-suppliers-tackle-ai-server-overheating-and-liquid-cooling-leaks